{
 "cells": [
  {
   "cell_type": "code",
   "outputs": [],
   "source": [
    "import re\n",
    "import pandas as pd\n",
    "from queue import Queue\n",
    "import jieba"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T08:09:05.152408600Z",
     "start_time": "2024-06-21T08:09:05.080408600Z"
    }
   },
   "id": "2e38a1eff7f7b6d",
   "execution_count": 43
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "id": "initial_id",
   "metadata": {
    "collapsed": true,
    "ExecuteTime": {
     "end_time": "2024-06-21T06:39:23.292730200Z",
     "start_time": "2024-06-21T06:39:23.152728600Z"
    }
   },
   "outputs": [],
   "source": [
    "combined_df_tongyi=pd.read_csv('toyi_shanghai_java_annual_salary.csv')"
   ]
  },
  {
   "cell_type": "code",
   "outputs": [],
   "source": [
    "# 识别含有NaN值的行\n",
    "rows_with_nan = combined_df_tongyi[combined_df_tongyi.isnull().any(axis=1)]"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T06:40:05.830717800Z",
     "start_time": "2024-06-21T06:40:05.803720300Z"
    }
   },
   "id": "d50ff4ec1847e785",
   "execution_count": 3
  },
  {
   "cell_type": "code",
   "outputs": [
    {
     "data": {
      "text/plain": "      job_id  company_id company_name                  job_title hr_name  \\\n2          3           3           熵央                Java高级开发工程师     严先生   \n5          6           6    某知名上市集团公司                技术架构师（Java）     乔先生   \n12        13          13         上海南天                   Java开发组长     范利君   \n40        41          41         上海高盎                  JAVA中级工程师     李先生   \n41        42          42   某知名计算机软件公司      AI大模型平台研发（天翼视联-海纳实验室）     李弯弯   \n...      ...         ...          ...                        ...     ...   \n3433    3454        2857    某500强上市公司                     资深后端开发     唐先生   \n3437    3458        2858      某大型保险公司                   高级java开发     卫女士   \n3457    3479        3062         同方鼎欣               Java中高级开发工程师     许女士   \n3462    3484        3066          爱达克  CodeBeamer二次开发工程师(J10627)     李诗雯   \n3463    3485        2926    某500强上市公司                java后端开发工程师     盖女士   \n\n      job_salary  annual_salary  \\\n2         17-28K          270.0   \n5     40-60K·15薪          750.0   \n12        20-25K          270.0   \n40        12-18K          180.0   \n41    20-40K·15薪          450.0   \n...          ...            ...   \n3433  40-70K·16薪          880.0   \n3437  26-35K·20薪          610.0   \n3457      14-19K          198.0   \n3462  15-20K·14薪          245.0   \n3463  35-65K·15薪          750.0   \n\n                                        job_description company_brief_address  \\\n2     【岗位职责】\\n1、对接产品需求，独立进行产品的概要设计、详细设计和代码实现工作\\n2、解决...             上海虹口区四川北路   \n5     岗位职责\\n1.       主导或深度参与重大项目的需求讨论、领域建模、架构设计工作，保障...                    上海   \n12    此岗位负责工商银行相关项目开发以及小团队管理工作，工作地点：虹口区曲阳路800号曲阳商务中心...               上海虹口区曲阳   \n40    技术要求\\n1扎实的Java编程基础，理解多线程；\\n2熟悉集合框架，常用的设计模式，具有一...             上海虹口区四川北路   \n41    天翼视联科技有限公司是中国电信的全资子公司，致力于构建全国统一的新型视联服务基础设施，打造服...                    上海   \n...                                                 ...                   ...   \n3433  1.带领一个研发小组完成系统建设，制定中长期的研发计划，保障在人/业务双象限上的可持续发展\\...                    上海   \n3437  岗位描述\\nJAVA基础扎实，熟悉I/0,多线程，分布式，集合等基础框架，对JVM原理有一定...                    上海   \n3457  有企业网关项目经验，一定的架构能力，了解类似开源网关Higress，Apache ShenY...               上海黄浦区外滩   \n3462  工作职责:\\n该职位需要提供技术解决方案，作为ALM相关活动的整体PMT解决方案的一部分。\\...               上海黄浦区外滩   \n3463  大厂，高并发等经验优先考虑\\n1. 深度参与大模型平台的基础架构和产品化研发,并部署到多个数...                    上海   \n\n      deleted     资历    学历  tags  \\\n2           0   3-5年    大专  java   \n5           0  5-10年    本科  java   \n12          0  5-10年    本科  java   \n40          0   3-5年    大专  java   \n41          0  5-10年    本科  java   \n...       ...    ...   ...   ...   \n3433        0   经验不限  学历不限  java   \n3437        0  5-10年    硕士  java   \n3457        0  5-10年    本科  java   \n3462        0   3-5年    本科  java   \n3463        0  5-10年    本科  java   \n\n                                                   技术要求                 工作领域  \\\n2                                                   NaN                  NaN   \n5     - 高并发/复杂系统架构设计\\n- 分布式系统设计原则\\n- 抽象能力与架构设计\\n- 技术...     互联网金融/信贷/资金/运营平台   \n12                                                  NaN                  NaN   \n40                                                  NaN                  NaN   \n41                                                  NaN                  NaN   \n...                                                 ...                  ...   \n3433  - 熟练 Java 和 RESTful\\n- MVC、OOP、AOP 理解\\n- 微服务架构...  企业级信息系统研发、信息化解决方案构建   \n3437  - 熟练Java（包括I/O、多线程、分布式、JVM）\\n- 精通Spring & Spri...      软件开发，尤其金融行业应用开发   \n3457  - 企业网关项目经验\\n- 开源网关（如Higress, Apache ShenYu）理解\\...      企业级应用开发，特别是金融行业   \n3462                                                NaN                  NaN   \n3463                                                NaN                  NaN   \n\n                 角色定位 工作经验  \n2                 NaN  NaN  \n5         高级架构师/技术领导者  NaN  \n12                NaN  NaN  \n40                NaN  NaN  \n41                NaN  NaN  \n...               ...  ...  \n3433      高级后端工程师/架构师  NaN  \n3437      全栈开发者，高级工程师  NaN  \n3457  高级JAVA开发工程师，架构师  NaN  \n3462              NaN  NaN  \n3463              NaN  NaN  \n\n[375 rows x 17 columns]",
      "text/html": "<div>\n<style scoped>\n    .dataframe tbody tr th:only-of-type {\n        vertical-align: middle;\n    }\n\n    .dataframe tbody tr th {\n        vertical-align: top;\n    }\n\n    .dataframe thead th {\n        text-align: right;\n    }\n</style>\n<table border=\"1\" class=\"dataframe\">\n  <thead>\n    <tr style=\"text-align: right;\">\n      <th></th>\n      <th>job_id</th>\n      <th>company_id</th>\n      <th>company_name</th>\n      <th>job_title</th>\n      <th>hr_name</th>\n      <th>job_salary</th>\n      <th>annual_salary</th>\n      <th>job_description</th>\n      <th>company_brief_address</th>\n      <th>deleted</th>\n      <th>资历</th>\n      <th>学历</th>\n      <th>tags</th>\n      <th>技术要求</th>\n      <th>工作领域</th>\n      <th>角色定位</th>\n      <th>工作经验</th>\n    </tr>\n  </thead>\n  <tbody>\n    <tr>\n      <th>2</th>\n      <td>3</td>\n      <td>3</td>\n      <td>熵央</td>\n      <td>Java高级开发工程师</td>\n      <td>严先生</td>\n      <td>17-28K</td>\n      <td>270.0</td>\n      <td>【岗位职责】\\n1、对接产品需求，独立进行产品的概要设计、详细设计和代码实现工作\\n2、解决...</td>\n      <td>上海虹口区四川北路</td>\n      <td>0</td>\n      <td>3-5年</td>\n      <td>大专</td>\n      <td>java</td>\n      <td>NaN</td>\n      <td>NaN</td>\n      <td>NaN</td>\n      <td>NaN</td>\n    </tr>\n    <tr>\n      <th>5</th>\n      <td>6</td>\n      <td>6</td>\n      <td>某知名上市集团公司</td>\n      <td>技术架构师（Java）</td>\n      <td>乔先生</td>\n      <td>40-60K·15薪</td>\n      <td>750.0</td>\n      <td>岗位职责\\n1.       主导或深度参与重大项目的需求讨论、领域建模、架构设计工作，保障...</td>\n      <td>上海</td>\n      <td>0</td>\n      <td>5-10年</td>\n      <td>本科</td>\n      <td>java</td>\n      <td>- 高并发/复杂系统架构设计\\n- 分布式系统设计原则\\n- 抽象能力与架构设计\\n- 技术...</td>\n      <td>互联网金融/信贷/资金/运营平台</td>\n      <td>高级架构师/技术领导者</td>\n      <td>NaN</td>\n    </tr>\n    <tr>\n      <th>12</th>\n      <td>13</td>\n      <td>13</td>\n      <td>上海南天</td>\n      <td>Java开发组长</td>\n      <td>范利君</td>\n      <td>20-25K</td>\n      <td>270.0</td>\n      <td>此岗位负责工商银行相关项目开发以及小团队管理工作，工作地点：虹口区曲阳路800号曲阳商务中心...</td>\n      <td>上海虹口区曲阳</td>\n      <td>0</td>\n      <td>5-10年</td>\n      <td>本科</td>\n      <td>java</td>\n      <td>NaN</td>\n      <td>NaN</td>\n      <td>NaN</td>\n      <td>NaN</td>\n    </tr>\n    <tr>\n      <th>40</th>\n      <td>41</td>\n      <td>41</td>\n      <td>上海高盎</td>\n      <td>JAVA中级工程师</td>\n      <td>李先生</td>\n      <td>12-18K</td>\n      <td>180.0</td>\n      <td>技术要求\\n1扎实的Java编程基础，理解多线程；\\n2熟悉集合框架，常用的设计模式，具有一...</td>\n      <td>上海虹口区四川北路</td>\n      <td>0</td>\n      <td>3-5年</td>\n      <td>大专</td>\n      <td>java</td>\n      <td>NaN</td>\n      <td>NaN</td>\n      <td>NaN</td>\n      <td>NaN</td>\n    </tr>\n    <tr>\n      <th>41</th>\n      <td>42</td>\n      <td>42</td>\n      <td>某知名计算机软件公司</td>\n      <td>AI大模型平台研发（天翼视联-海纳实验室）</td>\n      <td>李弯弯</td>\n      <td>20-40K·15薪</td>\n      <td>450.0</td>\n      <td>天翼视联科技有限公司是中国电信的全资子公司，致力于构建全国统一的新型视联服务基础设施，打造服...</td>\n      <td>上海</td>\n      <td>0</td>\n      <td>5-10年</td>\n      <td>本科</td>\n      <td>java</td>\n      <td>NaN</td>\n      <td>NaN</td>\n      <td>NaN</td>\n      <td>NaN</td>\n    </tr>\n    <tr>\n      <th>...</th>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n    </tr>\n    <tr>\n      <th>3433</th>\n      <td>3454</td>\n      <td>2857</td>\n      <td>某500强上市公司</td>\n      <td>资深后端开发</td>\n      <td>唐先生</td>\n      <td>40-70K·16薪</td>\n      <td>880.0</td>\n      <td>1.带领一个研发小组完成系统建设，制定中长期的研发计划，保障在人/业务双象限上的可持续发展\\...</td>\n      <td>上海</td>\n      <td>0</td>\n      <td>经验不限</td>\n      <td>学历不限</td>\n      <td>java</td>\n      <td>- 熟练 Java 和 RESTful\\n- MVC、OOP、AOP 理解\\n- 微服务架构...</td>\n      <td>企业级信息系统研发、信息化解决方案构建</td>\n      <td>高级后端工程师/架构师</td>\n      <td>NaN</td>\n    </tr>\n    <tr>\n      <th>3437</th>\n      <td>3458</td>\n      <td>2858</td>\n      <td>某大型保险公司</td>\n      <td>高级java开发</td>\n      <td>卫女士</td>\n      <td>26-35K·20薪</td>\n      <td>610.0</td>\n      <td>岗位描述\\nJAVA基础扎实，熟悉I/0,多线程，分布式，集合等基础框架，对JVM原理有一定...</td>\n      <td>上海</td>\n      <td>0</td>\n      <td>5-10年</td>\n      <td>硕士</td>\n      <td>java</td>\n      <td>- 熟练Java（包括I/O、多线程、分布式、JVM）\\n- 精通Spring &amp; Spri...</td>\n      <td>软件开发，尤其金融行业应用开发</td>\n      <td>全栈开发者，高级工程师</td>\n      <td>NaN</td>\n    </tr>\n    <tr>\n      <th>3457</th>\n      <td>3479</td>\n      <td>3062</td>\n      <td>同方鼎欣</td>\n      <td>Java中高级开发工程师</td>\n      <td>许女士</td>\n      <td>14-19K</td>\n      <td>198.0</td>\n      <td>有企业网关项目经验，一定的架构能力，了解类似开源网关Higress，Apache ShenY...</td>\n      <td>上海黄浦区外滩</td>\n      <td>0</td>\n      <td>5-10年</td>\n      <td>本科</td>\n      <td>java</td>\n      <td>- 企业网关项目经验\\n- 开源网关（如Higress, Apache ShenYu）理解\\...</td>\n      <td>企业级应用开发，特别是金融行业</td>\n      <td>高级JAVA开发工程师，架构师</td>\n      <td>NaN</td>\n    </tr>\n    <tr>\n      <th>3462</th>\n      <td>3484</td>\n      <td>3066</td>\n      <td>爱达克</td>\n      <td>CodeBeamer二次开发工程师(J10627)</td>\n      <td>李诗雯</td>\n      <td>15-20K·14薪</td>\n      <td>245.0</td>\n      <td>工作职责:\\n该职位需要提供技术解决方案，作为ALM相关活动的整体PMT解决方案的一部分。\\...</td>\n      <td>上海黄浦区外滩</td>\n      <td>0</td>\n      <td>3-5年</td>\n      <td>本科</td>\n      <td>java</td>\n      <td>NaN</td>\n      <td>NaN</td>\n      <td>NaN</td>\n      <td>NaN</td>\n    </tr>\n    <tr>\n      <th>3463</th>\n      <td>3485</td>\n      <td>2926</td>\n      <td>某500强上市公司</td>\n      <td>java后端开发工程师</td>\n      <td>盖女士</td>\n      <td>35-65K·15薪</td>\n      <td>750.0</td>\n      <td>大厂，高并发等经验优先考虑\\n1. 深度参与大模型平台的基础架构和产品化研发,并部署到多个数...</td>\n      <td>上海</td>\n      <td>0</td>\n      <td>5-10年</td>\n      <td>本科</td>\n      <td>java</td>\n      <td>NaN</td>\n      <td>NaN</td>\n      <td>NaN</td>\n      <td>NaN</td>\n    </tr>\n  </tbody>\n</table>\n<p>375 rows × 17 columns</p>\n</div>"
     },
     "execution_count": 4,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "rows_with_nan"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T06:40:07.508280900Z",
     "start_time": "2024-06-21T06:40:07.472282300Z"
    }
   },
   "id": "cbba7b904102be95",
   "execution_count": 4
  },
  {
   "cell_type": "code",
   "outputs": [],
   "source": [
    "#去掉nan值\n",
    "combined_df_tongyi.fillna(\"无\", inplace=True)"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T06:41:38.721277400Z",
     "start_time": "2024-06-21T06:41:38.705276Z"
    }
   },
   "id": "6493a429b6ba76a6",
   "execution_count": 5
  },
  {
   "cell_type": "code",
   "outputs": [
    {
     "data": {
      "text/plain": "      job_id  company_id company_name                  job_title hr_name  \\\n0          1           1         慧安金科                    后端开发工程师     张女士   \n1          2           2         中汇云链                       Java     黄翔煊   \n2          3           3           熵央                Java高级开发工程师     严先生   \n3          4           4      某知名物流公司                     JAVA开发     李先生   \n4          5           5           同威                Java高级开发工程师     傅荣斌   \n...      ...         ...          ...                        ...     ...   \n3459    3481        3064         易商数智                上海Java开发工程师      孙晶   \n3460    3482        2867           海魄             java开发工程师(中高级)     刘女士   \n3461    3483        3065          慷泰桐              Java高级工程师/架构师      王莹   \n3462    3484        3066          爱达克  CodeBeamer二次开发工程师(J10627)     李诗雯   \n3463    3485        2926    某500强上市公司                java后端开发工程师     盖女士   \n\n      job_salary  annual_salary  \\\n0     30-40K·15薪          525.0   \n1          5-10K           90.0   \n2         17-28K          270.0   \n3         15-25K          240.0   \n4         12-20K          192.0   \n...          ...            ...   \n3459      10-13K          138.0   \n3460      15-20K          210.0   \n3461      15-20K          210.0   \n3462  15-20K·14薪          245.0   \n3463  35-65K·15薪          750.0   \n\n                                        job_description company_brief_address  \\\n0     工作职责：\\n1、负责海外信贷业务相关系统设计、研发、迭代；\\n2、协助业务需求分析，将业务...               上海虹口区江湾   \n1     软件开发工程师\\n\\n岗位职责:\\n1、 负责系统开发、部署和集成，解决开发过程中的技术问题...              上海虹口区大柏树   \n2     【岗位职责】\\n1、对接产品需求，独立进行产品的概要设计、详细设计和代码实现工作\\n2、解决...             上海虹口区四川北路   \n3     岗位要求:\\n计算机及相关专业，大学本科以上学历，5 年以上开发经验\\n1.精通java 语...                    上海   \n4     1、理解架构师的职责和架构设计的目标、原则及取舍；\\n2、精通架构模式，IOC、AOP、SO...             上海虹口区四川北路   \n...                                                 ...                   ...   \n3459  1. 熟练掌握java编程语言\\n2. 熟练使用常用的java框架，如Spring,Myba...               上海黄浦区外滩   \n3460  岗位职责：\\n1、企业内部前端及后端服务的开发；\\n 2、根据系统的功能需求和技术规格进行编...              上海黄浦区城隍庙   \n3461  岗位职责：\\r\\n\\r\\n1、理解业务，识别需求，负责/参与技术架构设计、重构、优化，根据业...               上海宝山区大华   \n3462  工作职责:\\n该职位需要提供技术解决方案，作为ALM相关活动的整体PMT解决方案的一部分。\\...               上海黄浦区外滩   \n3463  大厂，高并发等经验优先考虑\\n1. 深度参与大模型平台的基础架构和产品化研发,并部署到多个数...                    上海   \n\n      deleted     资历  学历  tags  \\\n0           0  5-10年  本科  java   \n1           0   1-3年  本科  java   \n2           0   3-5年  大专  java   \n3           0   3-5年  本科  java   \n4           0  5-10年  本科  java   \n...       ...    ...  ..   ...   \n3459        0  5-10年  本科  java   \n3460        0  5-10年  大专  java   \n3461        0  5-10年  大专  java   \n3462        0   3-5年  本科  java   \n3463        0  5-10年  本科  java   \n\n                                                   技术要求  \\\n0     Java, Spring, MySQL, 分布式中间件 (如Dubbo, Sharding-...   \n1                                 初级软件工程师，企业级应用开发，MySQL   \n2                                                     无   \n3     Java, JVM, MySQL, 调优, SpringCloud, Nacos, Dubb...   \n4     Java、Spring、Spring Boot、Spring Cloud、J2EE、WebA...   \n...                                                 ...   \n3459  - Java编程\\n- Spring, MyBatis, Spring Boot\\n- Sp...   \n3460  Java, SpringBoot, SpringCloud, Nacos, MyBatis,...   \n3461  JavaEE，微服务架构，设计模式，开源框架（如SpringMVC, SpringCloud...   \n3462                                                  无   \n3463                                                  无   \n\n                       工作领域                  角色定位  \\\n0                海外信贷业务系统开发             系统架构师/开发者   \n1                      软件开发             系统开发者/工程师   \n2                         无                     无   \n3                软件开发，微服务架构       高级Java开发者/系统架构师   \n4     企业级应用架构、微服务架构、分布式系统开发           高级架构师/首席架构师   \n...                     ...                   ...   \n3459         Java后端开发，微服务架构      高级Java开发工程师或技术专家   \n3460   企业内部系统开发，尤其是后端与微服务架构  全栈开发工程师，负责前后端服务开发与测试   \n3461         WEB应用开发，系统架构优化         技术架构师/高级开发工程师   \n3462                      无                     无   \n3463                      无                     无   \n\n                                         工作经验  \n0                   5年以上Java开发经验，熟悉微服务架构和性能调优  \n1                                   1. 系统开发经验  \n2                                           无  \n3              5年以上相关开发经验，供应链开发经验优先，公有云部署经验优先  \n4                  大型J2EE项目架构设计经验，大数据产品研发经验优先  \n...                                       ...  \n3459                            3年以上项目开发及维护经验  \n3460  4-8年Java Web开发经验，ERP开发经验优先，有分布式和工作流开发背景  \n3461          5年以上，3年以上Web应用开发经验，有微服务架构实践经验优先  \n3462                                        无  \n3463                                        无  \n\n[3464 rows x 17 columns]",
      "text/html": "<div>\n<style scoped>\n    .dataframe tbody tr th:only-of-type {\n        vertical-align: middle;\n    }\n\n    .dataframe tbody tr th {\n        vertical-align: top;\n    }\n\n    .dataframe thead th {\n        text-align: right;\n    }\n</style>\n<table border=\"1\" class=\"dataframe\">\n  <thead>\n    <tr style=\"text-align: right;\">\n      <th></th>\n      <th>job_id</th>\n      <th>company_id</th>\n      <th>company_name</th>\n      <th>job_title</th>\n      <th>hr_name</th>\n      <th>job_salary</th>\n      <th>annual_salary</th>\n      <th>job_description</th>\n      <th>company_brief_address</th>\n      <th>deleted</th>\n      <th>资历</th>\n      <th>学历</th>\n      <th>tags</th>\n      <th>技术要求</th>\n      <th>工作领域</th>\n      <th>角色定位</th>\n      <th>工作经验</th>\n    </tr>\n  </thead>\n  <tbody>\n    <tr>\n      <th>0</th>\n      <td>1</td>\n      <td>1</td>\n      <td>慧安金科</td>\n      <td>后端开发工程师</td>\n      <td>张女士</td>\n      <td>30-40K·15薪</td>\n      <td>525.0</td>\n      <td>工作职责：\\n1、负责海外信贷业务相关系统设计、研发、迭代；\\n2、协助业务需求分析，将业务...</td>\n      <td>上海虹口区江湾</td>\n      <td>0</td>\n      <td>5-10年</td>\n      <td>本科</td>\n      <td>java</td>\n      <td>Java, Spring, MySQL, 分布式中间件 (如Dubbo, Sharding-...</td>\n      <td>海外信贷业务系统开发</td>\n      <td>系统架构师/开发者</td>\n      <td>5年以上Java开发经验，熟悉微服务架构和性能调优</td>\n    </tr>\n    <tr>\n      <th>1</th>\n      <td>2</td>\n      <td>2</td>\n      <td>中汇云链</td>\n      <td>Java</td>\n      <td>黄翔煊</td>\n      <td>5-10K</td>\n      <td>90.0</td>\n      <td>软件开发工程师\\n\\n岗位职责:\\n1、 负责系统开发、部署和集成，解决开发过程中的技术问题...</td>\n      <td>上海虹口区大柏树</td>\n      <td>0</td>\n      <td>1-3年</td>\n      <td>本科</td>\n      <td>java</td>\n      <td>初级软件工程师，企业级应用开发，MySQL</td>\n      <td>软件开发</td>\n      <td>系统开发者/工程师</td>\n      <td>1. 系统开发经验</td>\n    </tr>\n    <tr>\n      <th>2</th>\n      <td>3</td>\n      <td>3</td>\n      <td>熵央</td>\n      <td>Java高级开发工程师</td>\n      <td>严先生</td>\n      <td>17-28K</td>\n      <td>270.0</td>\n      <td>【岗位职责】\\n1、对接产品需求，独立进行产品的概要设计、详细设计和代码实现工作\\n2、解决...</td>\n      <td>上海虹口区四川北路</td>\n      <td>0</td>\n      <td>3-5年</td>\n      <td>大专</td>\n      <td>java</td>\n      <td>无</td>\n      <td>无</td>\n      <td>无</td>\n      <td>无</td>\n    </tr>\n    <tr>\n      <th>3</th>\n      <td>4</td>\n      <td>4</td>\n      <td>某知名物流公司</td>\n      <td>JAVA开发</td>\n      <td>李先生</td>\n      <td>15-25K</td>\n      <td>240.0</td>\n      <td>岗位要求:\\n计算机及相关专业，大学本科以上学历，5 年以上开发经验\\n1.精通java 语...</td>\n      <td>上海</td>\n      <td>0</td>\n      <td>3-5年</td>\n      <td>本科</td>\n      <td>java</td>\n      <td>Java, JVM, MySQL, 调优, SpringCloud, Nacos, Dubb...</td>\n      <td>软件开发，微服务架构</td>\n      <td>高级Java开发者/系统架构师</td>\n      <td>5年以上相关开发经验，供应链开发经验优先，公有云部署经验优先</td>\n    </tr>\n    <tr>\n      <th>4</th>\n      <td>5</td>\n      <td>5</td>\n      <td>同威</td>\n      <td>Java高级开发工程师</td>\n      <td>傅荣斌</td>\n      <td>12-20K</td>\n      <td>192.0</td>\n      <td>1、理解架构师的职责和架构设计的目标、原则及取舍；\\n2、精通架构模式，IOC、AOP、SO...</td>\n      <td>上海虹口区四川北路</td>\n      <td>0</td>\n      <td>5-10年</td>\n      <td>本科</td>\n      <td>java</td>\n      <td>Java、Spring、Spring Boot、Spring Cloud、J2EE、WebA...</td>\n      <td>企业级应用架构、微服务架构、分布式系统开发</td>\n      <td>高级架构师/首席架构师</td>\n      <td>大型J2EE项目架构设计经验，大数据产品研发经验优先</td>\n    </tr>\n    <tr>\n      <th>...</th>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n      <td>...</td>\n    </tr>\n    <tr>\n      <th>3459</th>\n      <td>3481</td>\n      <td>3064</td>\n      <td>易商数智</td>\n      <td>上海Java开发工程师</td>\n      <td>孙晶</td>\n      <td>10-13K</td>\n      <td>138.0</td>\n      <td>1. 熟练掌握java编程语言\\n2. 熟练使用常用的java框架，如Spring,Myba...</td>\n      <td>上海黄浦区外滩</td>\n      <td>0</td>\n      <td>5-10年</td>\n      <td>本科</td>\n      <td>java</td>\n      <td>- Java编程\\n- Spring, MyBatis, Spring Boot\\n- Sp...</td>\n      <td>Java后端开发，微服务架构</td>\n      <td>高级Java开发工程师或技术专家</td>\n      <td>3年以上项目开发及维护经验</td>\n    </tr>\n    <tr>\n      <th>3460</th>\n      <td>3482</td>\n      <td>2867</td>\n      <td>海魄</td>\n      <td>java开发工程师(中高级)</td>\n      <td>刘女士</td>\n      <td>15-20K</td>\n      <td>210.0</td>\n      <td>岗位职责：\\n1、企业内部前端及后端服务的开发；\\n 2、根据系统的功能需求和技术规格进行编...</td>\n      <td>上海黄浦区城隍庙</td>\n      <td>0</td>\n      <td>5-10年</td>\n      <td>大专</td>\n      <td>java</td>\n      <td>Java, SpringBoot, SpringCloud, Nacos, MyBatis,...</td>\n      <td>企业内部系统开发，尤其是后端与微服务架构</td>\n      <td>全栈开发工程师，负责前后端服务开发与测试</td>\n      <td>4-8年Java Web开发经验，ERP开发经验优先，有分布式和工作流开发背景</td>\n    </tr>\n    <tr>\n      <th>3461</th>\n      <td>3483</td>\n      <td>3065</td>\n      <td>慷泰桐</td>\n      <td>Java高级工程师/架构师</td>\n      <td>王莹</td>\n      <td>15-20K</td>\n      <td>210.0</td>\n      <td>岗位职责：\\r\\n\\r\\n1、理解业务，识别需求，负责/参与技术架构设计、重构、优化，根据业...</td>\n      <td>上海宝山区大华</td>\n      <td>0</td>\n      <td>5-10年</td>\n      <td>大专</td>\n      <td>java</td>\n      <td>JavaEE，微服务架构，设计模式，开源框架（如SpringMVC, SpringCloud...</td>\n      <td>WEB应用开发，系统架构优化</td>\n      <td>技术架构师/高级开发工程师</td>\n      <td>5年以上，3年以上Web应用开发经验，有微服务架构实践经验优先</td>\n    </tr>\n    <tr>\n      <th>3462</th>\n      <td>3484</td>\n      <td>3066</td>\n      <td>爱达克</td>\n      <td>CodeBeamer二次开发工程师(J10627)</td>\n      <td>李诗雯</td>\n      <td>15-20K·14薪</td>\n      <td>245.0</td>\n      <td>工作职责:\\n该职位需要提供技术解决方案，作为ALM相关活动的整体PMT解决方案的一部分。\\...</td>\n      <td>上海黄浦区外滩</td>\n      <td>0</td>\n      <td>3-5年</td>\n      <td>本科</td>\n      <td>java</td>\n      <td>无</td>\n      <td>无</td>\n      <td>无</td>\n      <td>无</td>\n    </tr>\n    <tr>\n      <th>3463</th>\n      <td>3485</td>\n      <td>2926</td>\n      <td>某500强上市公司</td>\n      <td>java后端开发工程师</td>\n      <td>盖女士</td>\n      <td>35-65K·15薪</td>\n      <td>750.0</td>\n      <td>大厂，高并发等经验优先考虑\\n1. 深度参与大模型平台的基础架构和产品化研发,并部署到多个数...</td>\n      <td>上海</td>\n      <td>0</td>\n      <td>5-10年</td>\n      <td>本科</td>\n      <td>java</td>\n      <td>无</td>\n      <td>无</td>\n      <td>无</td>\n      <td>无</td>\n    </tr>\n  </tbody>\n</table>\n<p>3464 rows × 17 columns</p>\n</div>"
     },
     "execution_count": 6,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "combined_df_tongyi"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T06:41:42.189858500Z",
     "start_time": "2024-06-21T06:41:42.163855400Z"
    }
   },
   "id": "f062c90bd3eb2787",
   "execution_count": 6
  },
  {
   "cell_type": "code",
   "outputs": [],
   "source": [
    "jishu=combined_df_tongyi['技术要求']"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T06:44:40.363807900Z",
     "start_time": "2024-06-21T06:44:40.341807300Z"
    }
   },
   "id": "ee4694db8b0abeb4",
   "execution_count": 7
  },
  {
   "cell_type": "code",
   "outputs": [
    {
     "data": {
      "text/plain": "'Java, Spring, MySQL, Dubbo, 分布式/缓存/消息/调度等'"
     },
     "execution_count": 9,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "jishu.loc[30]"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T06:45:33.783582500Z",
     "start_time": "2024-06-21T06:45:33.767583900Z"
    }
   },
   "id": "938a86ba702e88b3",
   "execution_count": 9
  },
  {
   "cell_type": "markdown",
   "source": [
    "去掉括号"
   ],
   "metadata": {
    "collapsed": false
   },
   "id": "ea8b3c861514f8c9"
  },
  {
   "cell_type": "code",
   "outputs": [
    {
     "data": {
      "text/plain": "'Java、Spring、Spring Boot、Spring Cloud、J2EE、WebAPI、Netty、架构设计、数据库（MySQL/SQLServer/NoSQL）、分布式系统、消息队列、规则引擎、工作流引擎、Linux、性能调优、设计模式、分布式缓存、分布式事务处理'"
     },
     "execution_count": 21,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "jishu.loc[4]"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T06:53:56.296308800Z",
     "start_time": "2024-06-21T06:53:56.286309600Z"
    }
   },
   "id": "1ca73056bf6a9cd0",
   "execution_count": 21
  },
  {
   "cell_type": "code",
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "Java、Spring、Spring Boot、Spring Cloud、J2EE、WebAPI、Netty、架构设计、数据库（MySQL/SQLServer/NoSQL）、分布式系统、消息队列、规则引擎、工作流引擎、Linux、性能调优、设计模式、分布式缓存、分布式事务处理\n"
     ]
    },
    {
     "data": {
      "text/plain": "['Java',\n 'Spring',\n 'Spring Boot',\n 'Spring Cloud',\n 'J2EE',\n 'WebAPI',\n 'Netty',\n '架构设计',\n '数据库（MySQL',\n 'SQLServer',\n 'NoSQL）',\n '分布式系统',\n '消息队列',\n '规则引擎',\n '工作流引擎',\n 'Linux',\n '性能调优',\n '设计模式',\n '分布式缓存',\n '分布式事务处理']"
     },
     "execution_count": 18,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "text=jishu.loc[4]\n",
    "print(text)\n",
    "# 定义一个正则表达式，其中'|'表示或，用于匹配多个分隔符\n",
    "split_pattern = re.compile(r',|/|，|、')  # 这里也包括了中文的逗号和顿号，根据实际需要可调整\n",
    "# 使用re.split进行分割\n",
    "keywords = split_pattern.split(text)\n",
    "\n",
    "# 去除空字符串\n",
    "keywords = [keyword for keyword in keywords if keyword]\n",
    "keywords"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T06:50:37.309087Z",
     "start_time": "2024-06-21T06:50:37.301088100Z"
    }
   },
   "id": "219499ee69648c65",
   "execution_count": 18
  },
  {
   "cell_type": "code",
   "outputs": [],
   "source": [
    "juese=combined_df_tongyi['角色定位']"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T06:59:29.074681100Z",
     "start_time": "2024-06-21T06:59:29.057013200Z"
    }
   },
   "id": "f93cf3cbca022417",
   "execution_count": 22
  },
  {
   "cell_type": "code",
   "outputs": [
    {
     "data": {
      "text/plain": "0                  系统架构师/开发者\n1                  系统开发者/工程师\n2                          无\n3            高级Java开发者/系统架构师\n4                高级架构师/首席架构师\n                ...         \n3459        高级Java开发工程师或技术专家\n3460    全栈开发工程师，负责前后端服务开发与测试\n3461           技术架构师/高级开发工程师\n3462                       无\n3463                       无\nName: 角色定位, Length: 3464, dtype: object"
     },
     "execution_count": 24,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "juese"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T06:59:35.730055300Z",
     "start_time": "2024-06-21T06:59:35.705511400Z"
    }
   },
   "id": "375d196d20c540e8",
   "execution_count": 24
  },
  {
   "cell_type": "code",
   "outputs": [],
   "source": [
    "juese_text=juese.loc[0]"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T07:00:42.425551500Z",
     "start_time": "2024-06-21T07:00:42.405880500Z"
    }
   },
   "id": "cb838f945b486216",
   "execution_count": 25
  },
  {
   "cell_type": "code",
   "outputs": [
    {
     "data": {
      "text/plain": "['系统架构师', '开发者']"
     },
     "execution_count": 26,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "# 定义一个正则表达式，其中'|'表示或，用于匹配多个分隔符\n",
    "split_pattern = re.compile(r',|/|，|、')  # 这里也包括了中文的逗号和顿号，根据实际需要可调整\n",
    "# 使用re.split进行分割\n",
    "keywords = split_pattern.split(juese_text)\n",
    "\n",
    "# 去除空字符串\n",
    "keywords = [keyword for keyword in keywords if keyword]\n",
    "keywords"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T07:00:49.052976100Z",
     "start_time": "2024-06-21T07:00:49.013918800Z"
    }
   },
   "id": "f951e6cafbd0904e",
   "execution_count": 26
  },
  {
   "cell_type": "code",
   "outputs": [],
   "source": [
    "def str_split(job_str):\n",
    "    # 定义一个正则表达式，其中'|'表示或，用于匹配多个分隔符\n",
    "    split_pattern = re.compile(r',|/|，|、|\\n')  # 这里也包括了中文的逗号和顿号，根据实际需要可调整\n",
    "    # 使用re.split进行分割\n",
    "    keywords = split_pattern.split(job_str)\n",
    "    \n",
    "    # 去除空字符串\n",
    "    keywords = [keyword for keyword in keywords if keyword]\n",
    "    return keywords"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T08:28:00.468045100Z",
     "start_time": "2024-06-21T08:28:00.454576300Z"
    }
   },
   "id": "6d52f3c538e67036",
   "execution_count": 56
  },
  {
   "cell_type": "code",
   "outputs": [],
   "source": [
    "test_pd=pd.DataFrame()"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T08:33:05.679866100Z",
     "start_time": "2024-06-21T08:33:05.667869800Z"
    }
   },
   "id": "d7a3da3c95cf04d2",
   "execution_count": 71
  },
  {
   "cell_type": "code",
   "outputs": [],
   "source": [
    "test_pd['juese']=combined_df_tongyi['角色定位'].apply(str_split)"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T08:33:05.901423900Z",
     "start_time": "2024-06-21T08:33:05.878424200Z"
    }
   },
   "id": "abfc8481c7fe8e6f",
   "execution_count": 72
  },
  {
   "cell_type": "code",
   "outputs": [
    {
     "data": {
      "text/plain": "                        juese\n0                [系统架构师, 开发者]\n1                [系统开发者, 工程师]\n2                         [无]\n3          [高级Java开发者, 系统架构师]\n4              [高级架构师, 首席架构师]\n...                       ...\n3459       [高级Java开发工程师或技术专家]\n3460  [全栈开发工程师, 负责前后端服务开发与测试]\n3461         [技术架构师, 高级开发工程师]\n3462                      [无]\n3463                      [无]\n\n[3464 rows x 1 columns]",
      "text/html": "<div>\n<style scoped>\n    .dataframe tbody tr th:only-of-type {\n        vertical-align: middle;\n    }\n\n    .dataframe tbody tr th {\n        vertical-align: top;\n    }\n\n    .dataframe thead th {\n        text-align: right;\n    }\n</style>\n<table border=\"1\" class=\"dataframe\">\n  <thead>\n    <tr style=\"text-align: right;\">\n      <th></th>\n      <th>juese</th>\n    </tr>\n  </thead>\n  <tbody>\n    <tr>\n      <th>0</th>\n      <td>[系统架构师, 开发者]</td>\n    </tr>\n    <tr>\n      <th>1</th>\n      <td>[系统开发者, 工程师]</td>\n    </tr>\n    <tr>\n      <th>2</th>\n      <td>[无]</td>\n    </tr>\n    <tr>\n      <th>3</th>\n      <td>[高级Java开发者, 系统架构师]</td>\n    </tr>\n    <tr>\n      <th>4</th>\n      <td>[高级架构师, 首席架构师]</td>\n    </tr>\n    <tr>\n      <th>...</th>\n      <td>...</td>\n    </tr>\n    <tr>\n      <th>3459</th>\n      <td>[高级Java开发工程师或技术专家]</td>\n    </tr>\n    <tr>\n      <th>3460</th>\n      <td>[全栈开发工程师, 负责前后端服务开发与测试]</td>\n    </tr>\n    <tr>\n      <th>3461</th>\n      <td>[技术架构师, 高级开发工程师]</td>\n    </tr>\n    <tr>\n      <th>3462</th>\n      <td>[无]</td>\n    </tr>\n    <tr>\n      <th>3463</th>\n      <td>[无]</td>\n    </tr>\n  </tbody>\n</table>\n<p>3464 rows × 1 columns</p>\n</div>"
     },
     "execution_count": 73,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "test_pd"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T08:33:06.039422800Z",
     "start_time": "2024-06-21T08:33:06.020423600Z"
    }
   },
   "id": "e9eb2f0becd0d2cd",
   "execution_count": 73
  },
  {
   "cell_type": "code",
   "outputs": [],
   "source": [
    "df_exploded = test_pd.explode('juese')"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T08:33:15.073677600Z",
     "start_time": "2024-06-21T08:33:15.059677900Z"
    }
   },
   "id": "3a910619b45d7230",
   "execution_count": 75
  },
  {
   "cell_type": "code",
   "outputs": [
    {
     "data": {
      "text/plain": "juese\n系统架构师               431\n架构师                 386\n后端开发工程师             223\n无                   215\n高级开发工程师             180\n                   ... \n物联网与AI技术支持            1\n智能感知平台开发工程师           1\n全栈开发工程师或高级后端开发人员      1\nGIS系统开发工程师            1\n负责前后端服务开发与测试          1\nName: count, Length: 1530, dtype: int64"
     },
     "execution_count": 78,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df_exploded['juese'].value_counts()"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T08:34:14.442855900Z",
     "start_time": "2024-06-21T08:34:14.402856900Z"
    }
   },
   "id": "634ab70fc88b2a49",
   "execution_count": 78
  },
  {
   "cell_type": "code",
   "outputs": [],
   "source": [
    "\n",
    "import jieba.posseg as pseg\n",
    "# 假设df_exploded是已经通过explode处理过的DataFrame\n",
    "# 假设这是你不想被分割的关键词列表\n",
    "protected_keywords = ['后端', '微服务','大数据','物联网']\n",
    "\n",
    "# 添加关键词到用户自定义词典\n",
    "for keyword in protected_keywords:\n",
    "    jieba.add_word(keyword)\n",
    "    \n",
    "# 定义一个分词函数\n",
    "def tokenize_text(text):\n",
    "    words = [word for word, flag in pseg.cut(text)]\n",
    "    return words"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T08:34:18.968894300Z",
     "start_time": "2024-06-21T08:34:18.943895400Z"
    }
   },
   "id": "ac9da713d288fd6e",
   "execution_count": 79
  },
  {
   "cell_type": "code",
   "outputs": [
    {
     "data": {
      "text/plain": "lingyu_tokens\n工程师     2387\n开发      1497\n高级      1432\n架构师     1413\nJava    1008\n        ... \n为          1\n大          1\n兼具         1\n发展         1\nC#         1\nName: count, Length: 613, dtype: int64"
     },
     "execution_count": 81,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "# 对'df_exploded'的'lingyu'列中的每个值应用分词函数\n",
    "df_exploded['lingyu_tokens'] = df_exploded['juese'].apply(tokenize_text)\n",
    "linyu_exploded = df_exploded.explode('lingyu_tokens')\n",
    "linyu_exploded['lingyu_tokens'].value_counts()"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T08:34:27.720204600Z",
     "start_time": "2024-06-21T08:34:27.480503900Z"
    }
   },
   "id": "8ccfcbcb78fe974f",
   "execution_count": 81
  },
  {
   "cell_type": "code",
   "outputs": [
    {
     "data": {
      "text/plain": "          lingyu lingyu_tokens\n0     海外信贷业务系统开发            海外\n0     海外信贷业务系统开发          信贷业务\n0     海外信贷业务系统开发            系统\n0     海外信贷业务系统开发            开发\n1           软件开发          软件开发\n...          ...           ...\n3461      系统架构优化            系统\n3461      系统架构优化            架构\n3461      系统架构优化            优化\n3462           无             无\n3463           无             无\n\n[15382 rows x 2 columns]",
      "text/html": "<div>\n<style scoped>\n    .dataframe tbody tr th:only-of-type {\n        vertical-align: middle;\n    }\n\n    .dataframe tbody tr th {\n        vertical-align: top;\n    }\n\n    .dataframe thead th {\n        text-align: right;\n    }\n</style>\n<table border=\"1\" class=\"dataframe\">\n  <thead>\n    <tr style=\"text-align: right;\">\n      <th></th>\n      <th>lingyu</th>\n      <th>lingyu_tokens</th>\n    </tr>\n  </thead>\n  <tbody>\n    <tr>\n      <th>0</th>\n      <td>海外信贷业务系统开发</td>\n      <td>海外</td>\n    </tr>\n    <tr>\n      <th>0</th>\n      <td>海外信贷业务系统开发</td>\n      <td>信贷业务</td>\n    </tr>\n    <tr>\n      <th>0</th>\n      <td>海外信贷业务系统开发</td>\n      <td>系统</td>\n    </tr>\n    <tr>\n      <th>0</th>\n      <td>海外信贷业务系统开发</td>\n      <td>开发</td>\n    </tr>\n    <tr>\n      <th>1</th>\n      <td>软件开发</td>\n      <td>软件开发</td>\n    </tr>\n    <tr>\n      <th>...</th>\n      <td>...</td>\n      <td>...</td>\n    </tr>\n    <tr>\n      <th>3461</th>\n      <td>系统架构优化</td>\n      <td>系统</td>\n    </tr>\n    <tr>\n      <th>3461</th>\n      <td>系统架构优化</td>\n      <td>架构</td>\n    </tr>\n    <tr>\n      <th>3461</th>\n      <td>系统架构优化</td>\n      <td>优化</td>\n    </tr>\n    <tr>\n      <th>3462</th>\n      <td>无</td>\n      <td>无</td>\n    </tr>\n    <tr>\n      <th>3463</th>\n      <td>无</td>\n      <td>无</td>\n    </tr>\n  </tbody>\n</table>\n<p>15382 rows × 2 columns</p>\n</div>"
     },
     "execution_count": 67,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "linyu_exploded"
   ],
   "metadata": {
    "collapsed": false,
    "ExecuteTime": {
     "end_time": "2024-06-21T08:29:11.811923400Z",
     "start_time": "2024-06-21T08:29:11.778926100Z"
    }
   },
   "id": "22d62d608441dda9",
   "execution_count": 67
  },
  {
   "cell_type": "code",
   "outputs": [],
   "source": [],
   "metadata": {
    "collapsed": false
   },
   "id": "8eccbdf02da687e4"
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 2
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython2",
   "version": "2.7.6"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 5
}
